AI经济学家:强化学习如何促进市场平等并提升生产效率
导语
政府收缴的税款可用于维系社会发展、维护社会公平。而面对日新月异的创新经济和层出不穷的避税手段,通过传统的经济学手段恐怕难以构建出更加完善的税收制度。来自 Salesforce 研究院的科研团队利用人工智能技术实现了一个可以自动提供税收政策的AI经济学家,并在实验中发现人工智能提供的政策要优于以往现行的税收政策。
集智俱乐部正在以「企业建模与发展预测」为主题组织为期2-3个月的读书会,探讨复杂科学与企业研究的结合,研读相关论文,激发科研灵感。经济系统建模是读书会探讨的课题之一。欢迎从事复杂系统技术研究、对企业发展问题感兴趣的朋友参加,详情见文末。
Stephan Zheng, Alexander Trott, Sunil Srinivasa等 | 作者
Leo | 翻译
赵雨亭 | 审校
邓一雪 | 编辑
经济上的不平等现象在全球范围内都在加剧,这一问题对经济机会、民众健康和社会福利带来的持续负面影响引发了人们的关注;同时,税收是政府进行财政转移支付、减少不平等现象的重要工具。研究人员一直致力于寻找一种能促进平等并提升生产效率的工具。人工智能经济学首次将强化学习引入了税收政策的设计中,仅需在模型和数据的基础上就可提供解决方案。 AI经济学家使用了两级的强化学习框架(模拟主体和税收政策),在有规则的经济模拟中来学习动态的税收政策。该框架并不适用人们预先知道的世界知识和假设,而是直接优化任何经济目标,并从中观察学习。 与 Emmanuel Saez 提出的税收政策相比,报道中的AI经济学家可以将收入平等与生产力提高之间的权衡关系改善16%。与美国现有的联邦税收制度与自由市场体质相比,AI 能让政府获得更大的收益。 在不依赖于税收表的情况下,AI经济学家所使用的税收表与随机模型并不相同:最高税收税率被提高,而中等收入的税率下降。而且面对新的避税博弈,这一税收方案的表现也是最稳定的。 此外,AI经济学家做出的决策在有人类参与的模拟中是有效的,与随机模型相比,平等与生产力之间的关系得以改善,同时提高了依收入加权的平均社会福利。这表明,利用人工智能方法可以改善真实的经济系统。 研究人员希望,AI经济学家可以用于研究真实世界的经济运作规律,这个问题的复杂程度是传统的研究方法所无法解决的。他们相信,机器学习与经济学的交集会发展出吸引人的研究方向,并对社会带来影响。
1. 强化学习以造福社会
1. 强化学习以造福社会
2. 最佳税收设计挑战
2. 最佳税收设计挑战
3. 收入、劳动、技能和效用的经济模型
3. 收入、劳动、技能和效用的经济模型
4. 中央税收的困境
4. 中央税收的困境
图1. 税收对社会效用收益的影响示意图。左图:税收可以通过转移收入来改善平等。然而,因为税收会打击工作的积极性,也会降低生产力。AI经济学家就试图在这个两个问题之间寻求一种平衡,而帕累托边界就是解决方案构成的集合。右图:税收对生产效率的影响(总收入,整体大方块的面积)和社会平等(内部小方块之间的大小差异)。在这样的实验中,AI经济学家给出了最佳的解决方案。
5. 将经济模拟作为学习环境
5. 将经济模拟作为学习环境
图2. 左图:在图中的经济模拟中,四个主体收集并交易资源、建造房屋进而获得收益。右图:财富分配不均。圆盘的大小表示生产力总值,而颜色自表示每个主体的占比。公平与生产力之间的权衡分数是通过二者的乘积来衡量的。
采集、交易与建设
技能与效用
专业分化
图3. 上图:单次游戏的模拟场景。中图:劳动技能强的主体通过更多的房屋建造以获得更高的收入。下图:参与模拟游戏的主体会在游戏过程中互相交易,向上的柱状图表示的是出售资源,向下的柱状图则表示购买资源。
6. 利用强化学习
把最优税收设计视为学习的奖励
6. 利用强化学习
把最优税收设计视为学习的奖励
图4. 两级强化学习模型:一个由劳动主体和政策制定者共同组成的学习框架。主体面临着一个不稳定的学习问题。政策制定者会改变税收,并影响到主体的税后实际收入。因此,对于相同的工作量,随着时间的推移,主体的效用也不相同,因此他们需要调整优化行为以实现效用的最大化。
在内部循环中,自利的工人从事劳动,获得收入并缴纳税款。他们通过反复的学习实验,以调整自己的行为,当自己的效用收益最大化。在给定税收政策的情况下,这是一个有固定目标的多主体强化学习问题。 在外部循环中,政策制定者会调整税收政策以优化社会目标。这样就形成了一个非固定的学习任务,在这样的学习任务中,主体需要不断地调整目标。 换言之,因为相同类型和劳动数量的税后收入会随时间变化,因此主体过去最优的决策,现在就可能不再是最优的。
7. AI驱动的税收政策
改善了生产力与公平之间的关系
7. AI驱动的税收政策
改善了生产力与公平之间的关系
定期所得税
研究人员对AI经济学家给出的政策和以下政策进行了对比:
没有税收与再分配的自由市场 折算后的美国2008年联邦税率(边际税收随收入增加而增加的累进税率) 伊曼纽尔·赛斯(Emmanuel Saez)提出的税收政策(边际税率随着收入的增加而降低)
用AI经济学家改善经济
图5. AI经济主体的社会收益。生产效率(左图,越高越好)衡量的一个模拟周期内生产带来的总收入(类似于GDP),相比较于自由市场,征税会导致生产力下降,但是在AI经济学家的指导下,生产力的损失降到了最小,收入公平(中图,越高越好)表现最好。二者的乘积(右图)则遥遥领先。(图中的黑线是标准差)
图6. 不同税收政策:Saez税收政策(上)、AI经济学家给出的方案(中)和自由市场(下)的模拟比较。AI经济学家给出的方案对效率与公平给出了最好的平衡。
转移支付与税收影响
图7. 左图:不同收入水平的总交税额度,在AI和Saez税收政策中,总税额最初增长较快,但在高收入中增长较慢。右图:税率表比较,边际税率表示,每增加一枚硬币收入要缴纳多少税款。
对抗税收博弈策略的稳健性
图9. 每一模拟周期中的收入与税收,可以看到不同时期的收入相差很大,左图显示了熟练工人的每期收入与假想收入的对比。右图是交税对比图。
人工智能驱动的税收政策与真实场景
驼峰式税率表带来了平等与效率关系的改善
图11. 无论是模拟实验还是真人参与的实验,驼峰式税率表都表现良好。在这种税收模式中,我们会看到税率的上升与下降。
图12. 在人类参与下,Saez(上)、AI经济学家(中)与自由市场(下)三种政策的比较。AI经济学家的结果要优于其他的政策。
图13. 有人类参与实验的社会收益。AI经济学家实现了效率与平等的权衡。其结果可以与美国联邦税收制度和Saez政策相抗衡,并在统计学意义上显著超过了自由市场政策。图中黑线是标准差,因为人类引入了竞争封锁行为,导致生产力差异更大。
加权社会福利显著提高
图14. 有人类参与实验中,AI经济学家的逆向加权社会福利指标也优于参考政策。
8. 发展方向
8. 发展方向
9. 伦理问题
9. 伦理问题
参考文献
Mastering The Game Of Go Without Human Knowledge. Silver, David, Julian Schrittwieser, Karen Simonyan, Ioannis Antonoglou, Aja Huang, Arthur Guez, Thomas Hubert et al. Nature 550, no. 7676 (2017): 354-359.
Grandmaster Level In Starcraft Ii Using Multi-Agent Reinforcement Learning. Vinyals, Oriol, Igor Babuschkin, Wojciech M. Czarnecki, Michaël Mathieu, Andrew Dudzik, Junyoung Chung, David H. Choi et al. Nature 575, no. 7782 (2019): 350-354.
Dota 2 With Large Scale Deep Reinforcement Learning. Berner, Christopher, Greg Brockman, Brooke Chan, Vicki Cheung, Przemysław Dębiak, Christy Dennison, David Farhi et al. arXiv preprint arXiv:1912.06680 (2019).
Optimal Auctions Through Deep Learning. Dütting, Paul, Zhe Feng, Harikrishna Narasimhan, David C. Parkes, and Sai Srivatsa Ravindranath. In International Conference on Machine Learning, pp. 1706-1715 (2019).
Inequality Matters. United Nations.
Literature Review On Income Inequality And The Effects On Social Outcomes. Beatrice d'Hombres, Anke Weber, and Leandro Elia. JRC Scientific and Policy Reports, 2012
Income Inequality and Health: What Have We Learned So Far? S. V. Subramanian, Ichiro Kawachi. Epidemiologic Reviews, Volume 26, Issue 1, July 2004, Pages 78–91
Rising Inequality Affecting More Than Two-Thirds Of The Globe, But It’s Not Inevitable: New UN Report. UN News.
Global Inequality. Inequality.org.
World Inequality Report. 2018
Using Elasticities To Derive Optimal Income Tax Rates. Saez, Emmanuel The Review Of Economic Studies 68.1 (2001): 205-229.
The New Dynamic Public Finance. Kocherlakota, Narayana R. Princeton; Oxford: Princeton University Press, 2010.
Agent-Based Modeling: Methods And Techniques For Simulating Human Systems. Bonabeau, Eric.Proceedings Of The National Academy Of Sciences 99, no. suppl 3 (2002): 7280-7287.
An Agent Based Model For Studying Optimal Tax Collection Policy Using Experimental Data: The Cases Of Chile And Italy. Garrido, Nicolás and Mittone, Luigi. The Journal of Socio-Economics 42 (2013): 24-30.
(参考文献可上下滑动查看)
企业建模与发展预测读书会启动招募
点击查看读书会详情:
推荐阅读
复杂经济学读书会启动招募,一起探索非均衡的、演化的经济系统 入门复杂性科学,从Netlogo课程开始 | NetLogo多主体建模社群正式启动 因果发现:如何让算法成为复杂系统中的“福尔摩斯”? 应该允许机器假装人类吗?毕竟这样它们的效率最高 图网络深度解析:为什么说图网络是 AI 的未来? 加入集智,一起复杂!
点击“阅读原文”,即可报名读书会